Русский BSD

Программный инструмент для оптического распознавания символов, то есть программа для распознавания текста. Она была первоначально разработана в Cognitive Technologies и, после нескольких лет без развития, выпущен как бесплатное программное обеспечение 12 декабря 2007 года. Ядро системы распознавания было выпущено под открытым исходным кодом лицензии BSD в начале апреля 2008 года. Программа переведена на русский язык.

Особенности

CuneiForm может сохранить форматирование текста, а также признает сложные таблицы (любой структуры).

Это Русско-английский двуязычный, Сербский, Словенский, Испанский, Шведский, Турецкий, и украинский текст.

CuneiForm может сохранить распознанный текст в формате RTF, HTML или текстовом формате. Он может также передать текст в Microsoft Word или Microsoft Excel.

Пользовательский интерфейс


Программу для распознавания можно использовать в качестве автономного приложения из командной строки, или в качестве фонового приложения с другими программами. Она поставляется с собственным графическим интерфейсом. Система распознавания текста может быть также использована в качестве двигателя OCR в OCRFeeder.

История


После того, как лидер программного обеспечения OCR в России, CuneiForm был в конкуренции с ABBYY FineReader.

В 1993 Cognitive Technologies подписала контракт OEM с Corel Corporation, которая позволила библиотеке Cognitive признания быть встроенной в популярный пакет публикации Corel Draw 3.0 (и последующие версии).

В 1996 году, OCR CuneiForm'96 был выпущен, который был первым пакетом OCR включающим адаптивный метод распознавания символов. Этот метод основан на сочетании двух видов печатных алгоритмов распознавания символов: multifont и omnifont. Это система самообучения способна распознавать плохо напечатанные символы, создавая внутренний шрифт, порожденную этими символами, которые были напечатаны достаточно хорошо, чтобы быть признанным. Таким образом, динамическая регулировка (адаптация) для конкретного ввода символов используется.

Вводные источники


Cognitive Technologies запустила программу, чтобы сделать OCR доступным для всех пользователей. Его первый шаг освобождал CuneiForm как бесплатное программное обеспечение.

Cognitive Technologies планирует начать развивать новую версию программного обеспечения как инвестор и координатор проекта. Разработчики выбрали лицензию BSD на выпуск, чтобы принять во внимание все юридические и технические нюансы, но целая программа или ее отдельные модули могут быть опубликованы позже лицензируемые под GPL.

В сентябре 2008 часть Cognitive была выпущена как общедоступное программное обеспечение. Одна из недостающих частей - анализ таблиц, однако Cognitive обещали выпустить этот компонент в будущем.

Cuneiform в настоящее время портирована на Linux, BSD и Mac OS X.

Резервная копия исходного кода: на Яндекс диске

Характеристики

Ссылки на официальный сайт и загрузку
  • Язык: Русский
  • ОС: Windows 10, Windows 7
  • Лицензия: BSD
  • Разработчик: Cognitive Technologies
  • Категория: Сканирование
  • Видеообзор: Отсутствует
  • VirusTotal: отчет
  • Подтверждение лицензии: Отсутствует
  • Создано: 28.03.2021
  • Обновлено: 26.01.2022